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摘 要 : 针对 跳 频 电台 细微 特征 集中 存在 宛 余 特 征 等 导致 电台 识别 时 存在 计算 量 大 、 识 别 准确 率 低 等 问题 ， 提 出 了 一 
种 基于 CMFS-MIC 特征 选择 的 跳 频 电台 个 体 识别 方法 。 首先 计算 采集 到 的 各 个 跳 频 电台 信号 样本 的 细微 特征 集 ， 然 后 
采用 关联 信息 业 度 量 特征 子 集 的 组 合 效 应 ， 兼 顾 考 虑 特征 间 的 关联 关系 和 完 余 关系 对 各 个 特征 进行 降序 排序 ， 在 此 基 
础 上 ,采用 最 大 信息 系数 度量 的 近似 马尔 可 夫 悉 方法 删除 宛 余 特 征 ， 实 现 对 特征 子 集 进行 优化 和 降 维 。 最 后 ， 设 计 了 
投票 组 合 分 类 器 实现 对 4 部 跳 频 电台 信号 的 识别 。 仿 真 结果 表明 ， 本 文 算法 具有 更 高 的 分 选 识别 率 。 
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Abstract: Due to the presence of irrelevant features and redundant features in the fine feature set of frequency hopping radio 
stations, the large amount of calculation and low recognition accuracy are existed for radio stations identification. This paper 


proposed an individual identification method for frequency hopping radio stations based on CMFS-MIC feature selection. 


i Firstly, the fine feature sets of each collected signal sample of frequency hopping radio were calculated, and then using the 
association information entropy to measure the combination effect of the feature subsets, taking into account the features’ 
relationship and the redundant relationship to sort each feature in descending order. On this basis, the approximate Markov 
blanket method using the largest information coefficient metric is used to remove redundant and irrelevant features. This 
process achieves the purpose of optimizing and reducing the dimension of feature subsets. Finally, it designed a voting 
combination classifier to realize the identification of four frequency-hopping radio signals. Simulation results show that 
proposed algorithm has higher sorting recognition rate. 

Key words: feature selection; frequency hopping radio; associated information entropy; maximum information coefficient; 


voting combination classifier 


识别 和 实施 电子 打击 等 军事 行动 具有 重要 意义 。 
现 有 跳 频 信号 的 网 台 分 选 和 电台 个 体 识别 技术 主要 可 以 分 
跳 频 通信 是 指 通信 双方 在 伪 随 机 码 和 同步 算法 的 控制 下 ， 为 两 大 类 : 基于 参数 估计 的 网 台 分 选 技术 和 基于 盲 源 分 离 的 网 
射频 频率 在 约定 频率 集 内 随 伪 随机 码 同步 跳 变 的 通信 。 这 种 通 。 ” 台 分 选 技术 。 其 中 ， 基 于 参数 估计 的 网 台 分 选 技术 主要 利用 跳 
信 方 式 因 其 具有 良好 的 抗 干扰 性 、 低 截获 概率 及 强 组 网 能 力 ， 频 信号 的 跳 周 期 、 DOA 信息 、 功 率 以 及 信号 时 间 相 关 性 等 参数 
广泛 应 用 于 军事 通信 中。 随 着 电磁 环境 日 趋 复 杂 ， 跳 频 电台 个 ” 信息 实现 跳 频 信号 识别 和 分 类 。 文 献 [2] 采 用 MUSIC 算法 估计 
体 识别 和 网 台 分 选 技术 已 经 成 为 通信 对 抗 领域 叹 待 解决 的 重要 ” 跳 频 信号 的 DOA， 并 用 其 进行 聚 类 分 析 实 现 跳 频 信号 的 分 选 ; 
题 。 同 时 ， 对 跳 频 电台 的 识别 技术 进行 研究 ， 并 将 每 部 跳 频 ”文献 [3] 利 用 估计 出 的 跳 频 信号 的 跳 周期 、DOA 信息 和 功率 ， 
电台 从 众多 的 跳 频 通信 网 络 中 分 选 出 来 ， 对 于 通信 侦察 、 政 我 ”结合 改进 的 K-means 算法 和 统计 直方 图 方法 进行 跳 频 信号 的 聚 
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录用 定稿 ,i 
类 分 选 。 这 类 算法 存在 的 主要 问题 是 可 估计 的 参数 数量 少 ， 估 提出 采用 对 称 不 确定 性 作为 相关 性 的 评价 标准 ， 考 虑 了 特征 与 
计 精 度 低 ， 分 选 正 确 率 对 特征 参数 估计 精度 依赖 大 ， 复 杂 战 场 类 别 之 间 、 特 征 与 特征 之 间 的 相关 性 进行 删除 元 余 特 征 ， 但 是 
电磁 环境 下 分 选 性 能 急剧 下 降 。 基 于 言 源 分 离 网 台 分 选 技术 主 算法 没有 综合 考虑 特征 子 集 的 组 合 效应 ;文献 [16,17] 将 数据 融 
要 采用 “两 步 走 ”， 即 先 估计 混合 矩阵 , 然后 在 混合 矩阵 已 知 的 合 领 域 中 的 关联 信息 炉 理论 应 用 于 特征 选择 中 ， 考 虑 了 特征 集 
条 件 下 利用 信号 的 稀 玻 性 完成 源 信号 和 噪声 的 分 离 ， 存 在 的 主 的 组 合 效 应 ， 即 不 同 特征 之 间 的 多 变量 关系 ， 但 是 会 出 现 最 优 
要 问题 是 源 信号 分 选 正 确 率 不 高 ， 欠 定 条 件 下 混合 矩阵 的 估计 寺 征 子 集 的 维 数 较 大 或 过 小 的 不 合理 情况 。 本 文 提出 改进 的 关 


难度 大 , 而 在 实际 电磁 环境 中 , 受 限 于 系统 复杂 度 和 载体 限制 ， 联 信息 炉 度量 的 特征 选择 方法 对 跳 频 信号 的 细微 特征 集 进行 优 


使 得 接收 到 的 混合 信号 个 数 往往 大 于 天 线 阵 元 数 ， 因 此 该 类 方 。 ”化 选择 ， 首 先 来 介绍 两 个 基本 概念 。 
法 实战 应 用 局 限 性 较 大 。 1.1 关联 信息 类 
考虑 到 即使 来 自 工艺 完全 相同 的 任意 两 部 电台 ， 在 信号 的 自 设 一 个 多 变量 系统 存在 N 个 变量 ,每 个 变量 的 不 同时 刻 


表示 形式 上 仍然 存在 着 不 影响 信息 传递 的 可 检测 、 可 重 现 的 多 1(1,2,.…,M ) 的 取 值 为 x(7) ,i=1,2,.….,N， 则 该 系统 构成 的 多 变量 
微 特征 差异 ， 通 过 提取 设备 的 这 些 细微 特征 差异 同样 可 以 实现 ”时间 序列 矩阵 为 
电台 的 分 选 。 近 年 来 已 有 部 分 研究 开始 聚焦 于 通过 提取 电台 的 


P=(x(DD mm PeR’ (1) 
细微 特征 进行 个 体 识别 ,文献 [5] 提 出 提取 跳 频 信号 瞬时 包 络 的 
庆 息 维 数 和 盒 维 数 , 并 采用 构造 神经 网 络 进行 分 类 识别 的 方法 ， ”其 中 : p 是 实 逢 阵 ， 对 其 进行 中 心 化 和 标准 化 处 理 之 后 得 到 @ ， 
于 双 谱 能 够 很 好 的 抑制 高 斯 噪声 ， 被 广泛 用 于 表征 信号 的 细 ”计算 其 相关 秆 阵 RR: 
微 特 征 ， 文 献 [6] 中 徐 书 华 等 人 提出 提取 信号 的 积分 双 谱 (SIB ) R=OrORER O) 
特征 ， 结 合 主 成 分 分 析 (PCA) 进行 特征 降 维 处 理 ， 最 终 利用 对 于 N 个 变量 的 关联 矩阵 尺 可 以 表示 如 下 : 
SVM 分 类 算法 在 场 外 实 采 数 据 集 上 实现 90% 以 上 的 分 辨 率 ,但 ee 
是 识别 效果 的 鲁 棒 性 较 低 ， 雷 迎 科 等 人 -9 在 文献 [6] 基 础 上 ， Ril 1 mk 攻 
建立 最 大 炳 模型 去 除非 高 斯 噪声 影响 ， 在 分 类 阶段 引入 了 协作 
表示 分 类 器 (CRC), 能 够 实现 同型 号 同 厂家 同 工 作 模式 的 不 同 mm m2 1 
FM 电台 个 体 识别 ， 并 获得 了 更 为 鲁 棒 而 快速 高 效 的 识别 效果 ; 其 中 :了 是 自 关联 矩阵 ,下 是 协 相关 矩阵 且 表 示 变 量 之 间 的 重 老 
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文献 [9] 考 虑 到 各 个 特征 对 电台 识别 率 的 重要 度 不 同 , 并 引入 邻 
域 粗糙 的 数据 集 简 约 算法 ， 对 各 个 特征 在 分 类 中 的 重要 度 进行 
评估 ， 设 计 了 加 权 投 票 组 合 分 类 器 ， 提 高 了 分 类 识别 率 ， 但 是 
没有 降低 计算 复杂 度 ; 文献 [10] 通 过 仿真 表明 并 不 是 把 所 有 的 
特征 简单 的 拼凑 在 一 块 就 可 以 作为 特征 集 ， 特 征 越 多 并 不 意味 ” ”信息 炉 定义 为 (7 
着 能 获得 最 好 的 识别 率 , 并 提出 采用 PCA 选择 出 重要 度 高 的 特 


信息 的 大 小 。 假 设 矩阵 R,7, 丰 的 特征 值 分 别 为 48,44,4* ， 则 满 


N N N 二 
是 从 >0; 六 入 =》 + 和。 根据 信息 论 计算 原理 ， 关 联 
i=1 i=1 i=1 


en 


an 


ny 4 
Hi =—》 ——log,—— (4) 
和 N N 


征 进行 分 类 ， 但 是 此 方法 忽略 了 特征 之 间 的 宛 余 性 。 
综 上 所 述 ， 提 取 电 台 信 号 的 多 个 细微 特征 ， 选 择 出 对 识别 对 为 单位 矩阵 7 的 特征 值 均 为 1， 则 太 , =1， 所 以 有 

六 fr 田 晤 人 圭 千 子 集 ， 结合 学 习 等 了 类 a 里 论 3 可 N R R 

效果 最 好 的 特征 了 并 结合 机 器 学 习 等 分 类 器 设计 理论 来 实 H.=1- HY 1 1+4 (人 1+4 (5) 

现 电台 分 选 识别 逐渐 成 为 新 的 研究 趋势 。 本 文 提出 改进 的 关联 a TFN WN N 

六 息 坑 度量 的 特征 选择 方法 对 跳 频 信号 的 细微 特征 集 进行 优 i 。 si 

计 息 烂 度量 的 特征 选择 方法 对 跳 频 信号 的 细微 特征 集 进 行 优化 结合 特征 值 满足 的 条 件 和 起 (5) 可 知 ， 当 18 _0 时 ， 

选择 ， 并 构造 投票 组 合 分 类 器 实现 跳 频 电 台 的 分 选 。 为 了 验证 

本 文 所 提 算 法 的 有 效 性 , 实验 分 别 在 UCI 部 分 数据 集 和 跳 频 信 ”” 认 = 刀 =1， 表 明 各 个 变量 之 间 相 互 独立 ， 提 供 了 完全 不 同 的 

号 特征 集 上 进行 分 析 ， 以 分 选 正确 率 作为 评判 标准 。 信息 , 此 时 系统 中 没有 重合 信息 , 关联 信息 炉 1, =1，Hji =0; 

1 ”预备 知识 当 X48 z0 时 ， 系 统 存在 重 关 信 息 。 


特征 选择 是 指 从 已 有 的 M 个 特征 中 剔除 不 相关 或 元 余 的 ”1.2 最 大 信息 系数 
特征 ， 选 择 N 个 最 有 效 的 特征 作为 新 的 特征 子 集 (M>N)， 使 Reshef 等 人 于 2011 年 在 Sicence 上 提出 了 一 种 新 的 基于 信 
得 新 的 特征 子 集 在 完成 分 类 任务 时 大 大 降低 计算 复杂 度 的 同 ” 息 论 的 度量 标准 一 一 最 大 信息 系数 。 最 大 信息 系数 不 仅 能 够 度 
时 ， 能 够 提供 与 原始 数据 集 近 似 或 者 更 优 的 识别 能 力 。 文 献 ” 量 大 量 数据 中 变量 间 的 线性 与 非 线 性 关系 ， 而 且 对 不 能 使 用 单 
[11-13] 提 出 基于 互信 息 的 特征 选择 方法 ， 考 虑 了 特征 与 类 别 之 。 个 函数 表示 的 非 函 数 依赖 关系 也 十 分 有 效 09。 
间 的 相关 性 ， 但 是 没有 充分 考虑 特征 之 间 的 匈 余 性 ， 会 带 来 较 最 大 信息 系数 主要 利用 互信 息 和 网 格 划分 方法 进行 计算 。 
多 宛 余 信息 ， 并 且 算 法 需要 指定 选择 的 特征 个 数 ;文献 [14,15] ” 假设 给 定 变 量 X={x,i=1,23..,n} 和 了 ={y,,i=1,2,...,n}，n 为 
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样本 数 ， 对 于 有 限 样 本 对 的 集合 D={(x,y,),i=1,2,.…,n} ， 定 义 
G 划分 将 变量 x 的 值 域 分 成 x 段 , 将 y 的 值 域 分 成 y> 段 ，G 即 
为 xxy 的 网 络 。 在 得 到 的 每 一 种 网 格 划分 中 计算 互信 息 
I(X:Y) ， 相 同 的 xxy 网 格 划分 方式 可 以 有 多 种 ， 选 择 最 大 值 
作为 G 的 互信 息 值 。 定 义 划分 G 下 数据 p 的 最 大 互信 息 公式 
为 


T'(X;Y)= max(1(D| OG) (6) 
其 中 : Dp |G 表示 数据 p 在 使 用 G 进行 划分 。 将 不 同 划 分 下 得 到 
的 最 大 互信 息 值 组 成 特征 和 矩阵， 特征 矩阵 1(D),, 定义 为 


1(D). 这 2 (7) 
~ logmin{x, y} 
则 最 大 信息 系数 定义 为 
MIC(D) = max {1(D).,,} (8) 


其 中 : B(n) 为 网 格 划 分 xxy 的 上 限 值 ， 文 献 [19] 中 通过 大 
量 实验 给 出 当 p(n) = zs 时 效果 最 好 。 

给 定 一 个 样本 的 特征 集 五 ={f, 户 ,…,f,c}， 样 本 数 为 Ny， 
类 别 为 c ， 对 于 任意 特征 f 和 类 别 。 的 相关 性 定义 为 
MIC(f.,c)， 值 越 大 表明 特征 f 和 类 别 c 间 的 相关 性 越 大 ，/ 为 
强 相 关 特 征 ， 越 倾向 于 保留 ， 反 之 则 为 弱 相 关 特 征 ， 需 要 被 删 
除 。 对 于 任意 两 个 特征 f 和 方 的 元 余 性 定义 为 MITC(CA, 广 ) ， 
MIC(f,f)) 越 大 说 明 两 个 特征 间 的 可 代替 性 越 强 ， 即 匈 余 性 越 
强 ， 需 要 剔除 其 中 一 个 特征 ， 反 之 ， 当 MIC(f,f,) 的 值 为 0 时 ， 
说 明 记 和 方 相互 独立 ， 都 需要 保留 。 


2 ”本 文 算法 
2.1 改进 的 关联 信息 灶 度量 的 特征 选择 算法 
设 原始 数据 集 p 中 有 个 样本 DD={4,q,,…,qd,}， 其 中 每 
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1 max(l,) — min(l.,) 
Re 2 


加 二 于 wo) 
i 7 


c) 计 算 和 矩阵 Re;7 的 特征 值 向 量 ， 根 据 式 (4) (5) 计算 全 体 
特征 值 下 的 ,和 五;; 

dj) 对 每 一 个 x ， 根 据 Info(i)=H, 一 HH,,,(%,) 计算 失去 特征 
x 后 见 余 信 息 的 增加 量 , 其 中 及, 为 全 体 特征 下 的 关联 信息 炳 ， 
及 ,i(%,) 为 失去 特征 x 后 的 关联 信息 业 ; 

© 根据 SQ)=argmax(Info(i)) 选择 第 1 个 特征 ， 每 一 个 
x eX-S， 添 加 x 到 集合 s 中 ， 扩 充 后 的 相关 和 矩 阵 为 Re ， 


计算 扩充 集合 后 的 关联 信息 灶 ; 


(11) 


ARel el 

Ha)= Hs,) i (12) 

六 对 于 未 排序 的 特征 集合 和 -3 根 据 

S(1) =argmax(H,( 站 ,1 =2,.…N 和 迭代 排序 ，X = 和 -9， 直 到 
l=p。 

CMEFS 算法 通过 特征 排序 的 方式 确保 了 前 p 维特 征 形成 的 

和 寺 征 子 集 是 低 见 余 的 ， 并 且 关 联 信 息 炉 最 大 ， 但 是 无 法 自 适应 

的 选择 特征 子 集 ， 需 要 人 工 参 与 设 定 维 数 p 。 文 献 [17] 引 入 浆 


值 进行 子 集 规模 的 自 适 应 控制 , 称 为 CMFS-n 算法 , 与 CMFS 
算法 不 同 的 地 方 在 于 步骤 6 中 , 当 满 足 Fj)>n,H,;,(D)<1-n 
时 , 把 x 加 入 集合 s 中; 当 加 入 x 带 来 的 元 余 信 息 超出 1-7 的 
限制 时 ， 算 法 迭代 终止 。CMFS-n 算法 实现 了 特征 子 集 的 自 适 
应 调控 ， 存 在 的 根本 问题 是 7 的 取 值 如 何 选择 ， 当 7 较 小 时 ， 
允许 带 入 1-7 的 元 余 信 息 ,特征 子 集 规模 几乎 等 于 原始 集合 规 
模 ， 没 有 达到 降 维 的 目的 ， 当 了 7 较 大 时 ， 人 允许 加 入 的 宛 余 信 息 
较 小 ， 留 下 的 特征 数 过 少 ， 影 响 分 选 识别 率 。 文 献 [17] 通 过 大 


个 样本 d, 都 由 N 个 特征 构成 集合 义 = 目标 集合 


量 实验 ， 综 合 考虑 了 分 类 识别 正确 率 和 计算 效率 两 方面 进行 确 


在 


C 中 有 jy 个 不 同 的 类 别 C={c,c ,cv,} ， 特 征 选择 就 是 要 
NN 维特 征集 合 中 选择 出 一 个 最 佳 特征 子 集 9， 其 中 8 中 含有 p 
维特 征 ( p < N )。 该 特征 子 集 8 在 分 类 识别 过 程 中 提供 了 与 x 
近似 或 者 更 优 的 识别 能 

基于 关联 信息 炳 度量 的 特征 选择 方法 CM 算法 简 


定 阐 值 ; ， 但 是 只 能 给 出 一 个 性 能 较 好 的 范围 ， 而 且 对 于 不 同 
的 数据 集 取 值 还 不 一 样 ， 这 种 通过 大 量 实验 来 反 推 寻找 最 优 赣 
值 7 的 方法 严重 增加 了 算法 的 计算 复杂 度 。 
文献 [18] 提 出 基于 最 大 信息 系数 的 度量 标准 的 近似 马尔 可 
夫 毯 的 特征 选择 方法 ， 首 先 用 FCBF 算法 以 对 称 不 确定 性 度量 
作 特 征 排序 和 删除 弱 相 关 特 征 ， 然 后 运用 近似 马尔 可 夫 毯 删除 


述 如 下 0 7: 

a) 计 算 每 一 个 特征 和 相应 类 别 的 互信 息 1; ， 并 构造 多 变量 

实 和 矩阵 p ， 式 中 瓦 (e 为 粹 ， 五 (。,。) 为 联合 人 ; 
1;=1x%;c))= H(x)+H(c,)-H(x,,c)) (9) 

| 六 1, Tu | 
P= 轩 扣 fan (10) 

LI Ts “ Tn J 
b) 对 实 矩 阵 尸 做 中 心 化 和 标准 化 得 到 Cr =[ 广 ] ,并 计算 特 


征 相 关 和 矩阵 Rel = Q#Q;; 


元 余 信息 ， 得 到 最 优 特征 子 集 。 受 此 启发 ， 本 文 也 采用 近似 马 
尔 可 夫 牧 方法 来 删除 见 余 信息 ， 实 现 自 适应 选择 特征 子 集 。 

定义 1 近似 马尔 可 夫 秩 。 对 于 两 个 特征 x 和 x(iz 让 ,x 
是 x 的 近似 马尔 可 夫 牧 的 条 件 是 : MIC(%,c) > MIC(x,,c)， 并 
H MIC(x;,c) < MIC(x,,x)) 。 

定义 2 ” 主 元 素 。 一 个 特征 x 为 主 元 素 ， 当 且 仅 当 特征 引 
中 没有 元 素 是 x 的 近似 马尔 可 夫 筷 ; 对 于 任意 一 个 数据 集 ， 所 
有 主 元 素 组 成 的 特征 子 集 为 最 优 特 征 子 集 。 
基于 以 上 分 析 ， 本 文 提 出 了 改进 的 关联 信息 炉 度 量 的 特征 
选择 算法 , 简写 为 CMFS-MIC， 先 用 CMFS 算法 进行 特征 值 排 
序 ， 再 用 最 大 信息 系数 度量 的 近似 马尔 可 夫 悉 去 除 元 余 特 征 


uy 
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od 1 En 

1 | 

输入 : 数据 集 p 、 特 征集 合 X 、 类 别 信息 C 二 
输出 :最 优 特征 子 集 5,， l 
| 

1 

L 


1 

1 

1 自 高 阶 ] 特 征 ， 信息 维 数 , 盒 维 
| 数 , LZC， 包 络 峰 度 ,SIB 等 


a)~e) 与 CMFS 算法 的 步 又 a)~e) 相 同 ; 

人 计算 方法 与 CMFS 算法 的 步骤 人 相同， 但 是 对 N 维特 征 
都 进行 特征 排序 并 放 入 8 中 ; 
多 选 择 $ 中 的 第 一 个 特征 x 为 主 元 素 ， 添 加 到 5,, 中 ， 
查找 以 x 为 马尔 可 夫 毯 的 特征 子 集 {zj} ， 将 见 余 特征 子 集 {x,} 
从 s 中 删除 ， 得 到 新 的 8 ; 

b) 重 复 步 又 g)， 直 到 SS = ， 输 出 5 。 
2.2 投票 组 合 分 类 器 设计 从 和 人 条 半天 贡生 

分 类 器 设计 时 ， 构 建 组 合 分 类 器 进行 分 类 ， 组 合 分 类 器 融 -=-------- 
合 多 个 分 类 器 的 决策 后 ， 通 过 一 个 组 合 器 对 不 同 分 类 器 的 输出 图 2 ”本文 算 法 总 体 流程 框图 
作 第 二 次 判决 ， 可 以 获得 更 好 的 分 类 性 能 。 
在 跳 频 信号 特征 集中 积分 双 谱 特征 〈SIB ) 与 径 向 积分 双 3 实验 纺 果 与 分 析 
谱 CRIB )、 轴 向 积分 双 谱 (AIB)、 圆 周 积分 双 谱 (CIB) 三 种 ”3.1 实验 1 
高 阶 谱 特征 相 比 ， 具 有 更 好 的 时 移 不 变性 、 尺 度 变 化 性 和 相位 为 了 验证 本 文 提出 的 特征 选择 算法 CMFS-MIC 的 有 效 性 ， 
保持 性 等 优势 ， 在 分 类 中 最 能 体现 辐射 源 的 个 体 差 异 ， 因 此 本 ”选择 在 UCI 机 器 学 习 库 中 上 选择 几 个 常用 数据 集 (如 表 1) 进 
文 在 双 谱 特征 中 只 关注 SIB 特征 。 男 外 ， 文 献 [9-10] 仿 真实 验 。” 行 特征 选择 , 并 与 经 典 的 特征 选择 算法 FCBF、CMFS-n 作 比 较 ， 
表明 高 维 矢量 SIB 单独 分 类 效果 好 ， 但 是 和 其 他 低 维 特征 合成 ”采用 了 SVM 、CRC 2 种 分 类 器 进行 对 比 实验 。 实 验 过 程 中 采 
新 的 特征 矢量 分 选 识别 率 反 而 降低 ， 故 而 本 文 设计 的 组 合 分 类 随机 抽取 的 方式 从 原始 数据 分 为 50% 的 训练 样本 和 50% 的 测 
器 将 SIB 特征 集 和 低 维特 征集 分 别 输入 两 个 CRC 分 类 器 四 和 ” 试 样本 。 为 了 提高 实验 的 准确 性 , 重复 试验 10 次 并 求 其 均值 作 
两 个 SVM 分 类 器 进行 分 类 ， 最 后 对 4 个 分 类 器 的 结果 进行 投 。” 为 实验 的 最 后 结果 。 


a 


投票 组 合 分 类 器 


Se 


票 组 合 判决 。 投 票 组 合 分 类 器 如 图 1 所 示 。 表 1 UCI 数 据 集 
一 数据 集 样本 数 特征 维 数 类 别 数 
EE Dermat 366 34 6 
] | Spambase 4601 57 2 
CRC 分 类 器 | SVM 分 类 器 | | CRC 分 类 器 || SVM 分 类 器 Arrhyth 279 452 16 
| | | Colon 62 2000 5 
投票 组 合 分 类 器 表 2 和 3 分 别 给 出 了 FCBF、CMFS-n 和 CMFS-MIC 在 表 
1 数据 集 上 的 特征 降 维 能 力 和 三 种 不 同方 法 选择 的 最 优 特征 子 
集 在 测试 集 上 的 分 类 准确 率 。 其 中 ，CMFS-n 算法 的 阔 值 7 通 
过 多 次 实验 仿真 综合 考虑 分 类 成 功率 与 特征 降 维 来 选 定 ， Full 
图 1 投票 组 合 分 类 器 来 表示 数据 全 集 ，Average 表示 均值 。 
2.3 本文 算法 流程 表 2 三 种 特征 选择 算法 选择 的 特征 数 
综合 以 上 对 特征 选择 算法 CMFS-MIC 以 及 加 权 组 合 分 类 数据 集 维 数 FCBF CMFS-n CMFS-MIC 
器 的 理论 分 析 , 提出 了 基于 CMFS-MIC 特征 选择 的 跳 频 电台 分 Dermat 34 12.5 11 9.2 
选 方法 ， 算 法 的 总 体 流 程 框架 如 图 2 所 示 。 Spambase 57 16.3 15.4 13.1 
Arrhyth 452 11.8 10 8.6 
Colon 2000 22 19.2 18 


从 表 2 中 可 知 三 种 算法 均 能 实现 降 维 ， 但 是 降 维 能 力 存在 
缺陷 , 本 文 提出 的 特征 选择 算法 CMFS-MIC 在 这 四 个 数据 集中 
均 得 到 了 更 少 的 特征 维 数 ， 降 维 能 力 优 于 其 他 两 种 算法 。 从 表 
3 可 以 看 到 ， 相 比 于 FCBF 算法 ，CMFS-MIC 能 够 用 较 小 的 数 
据 特征 维 数 实现 了 更 高 的 识别 率 ; CMFS-MIC 算法 与 CMFS-n 
算法 相 比 ， 在 分 类 效果 上 各 有 优势 ， 但 是 CMFS-n 存在 特征 选 


择 时 选择 的 阐 值 7 需要 多 次 实验 得 到 ， 选 择 不 同 的 值 对 分 类 结 
果 和 特征 选 维 数 影响 较 大 ， 鲁 棒 性 较 差 且 实 现 过 程 耗 时 多 。 此 
外 ， 特 征 选择 之 后 ， 不 同 数据 集 在 不 同 分 类 器 上 准确 率 均 有 一 
定 提 高 ， 在 同一 数据 集 上 ，CRC 算法 分 类 的 准确 率 高 于 SVM 
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算法 。 
表 3 三 种 特征 选择 方法 在 UCI 数据 集 上 的 分 选 结果 (%) 
SVM CRC 
数据 集 
Full FCBF CMFS-n CMFS-MIC Full FCBF CMFS-n CMFS-MIC 

Dermat 90.12 89.88 90.64 91.85 91.67 91.01 92.49 92.20 
Spambase 85.13 84.24 85.37 85.20 85.32 86.22 86.87 86.95 
Arrhyth 57.56 60.72 61.81 62.13 60.79 62.30 63.83 64.25 
Colon 73.34 77.45 78.56 78.29 75.31 75.44 76.72 77.16 
Average 76.54 77.07 79.09 79.37 78.52 78.90 79.98 80.14 


3.2 实验 2 
本 实验 首先 对 同型 号 的 4 部 短波 跳 频 电台 信号 进行 数据 采 
， 数 据 采 集 仪器 为 Tektronix DPO 7254 数字 荧光 示波器 ， 采 
样 率 高 达 40 GHz/s， 每 部 电台 采 100 个 样本 ，50 个 用 于 训练 ， 
50 个 用 于 测试 ,实验 平台 为 Lenovo T440S 的 PC 机 , 内存 12G， 
处 理 器 Intel% CoreIMi7-4600U CPU @2.10 GHz, Windows 7 64 
bit 操作 系统 ， 仿 真 软件 是 MATLAB R2014a。 

对 采集 到 的 4 部 跳 频 电台 的 信号 样本 分 别 预 处 理 并 计算 特 
设 获 得 特征 集 和 及 ， 记 为 
F={fi,f, fa fa fs fos fr fos fo}’ B={fio, 其 中 及: 
谱 对 称 均值 ， 户 : 谱 对 称 方差 ， f : 瑞 利 粹 f,: 信息 维 数 ; 
户 : 盒 维 数 ，f: LZC; 万 : 包 络 峰 度 ; f: 高 阶 J 特征 均 
值 ， f,: 高 阶 J 特征 方差 ， fi5(i=1,2,.….,256) : SIB。 类 别 


nt 


征集 ， 


并 


局 
C={1,2,3,4} ， 刀 和 已 经 过 CFMS -MIC 特征 选择 得 到 的 最 优 


子 集 玉 ={ 户 , 广 , 访 及 和 已 ={jio 记 JP) ， 构 造 特 征集 
已 ={ 忆 ,已 }， 已 ={E, 谎 }。 由 于 采用 CRC 分 类 器 得 到 的 效果 
比 SVM 分 类 效果 好 ， 本 文 只 给 出 了 CRC 分 类 器 在 不 同 特征 集 
下 的 识别 率 与 本 文 算法 的 识别 率 进行 比较 ， 如 表 4 所 示 。 

对 表 中 结果 进行 分 析 : 比较 FE 和" 、F_ 和 Fr 的 结果 表明 ， 
不 论 是 常规 低 维特 征集 还 是 高 维 积分 双 谱 特 征集 ， 特 征 选择 之 
后 得 到 特征 集 的 分 类 识别 率 均 略 低 于 原始 特征 集 ， 但 是 差别 不 
大 ， 表 明 在 CEMsS _MiC 特征 选择 获得 的 特征 集 仍然 具有 与 原 
始 特征 集 近 似 的 分 选 能 力 , 但 是 维 数 大 大 降低 了 ; 比较 巨 和 到 
的 结果 表明 ， 所 有 特征 的 集合 得 到 的 识别 率 还 不 如 采用 
CFMS -MIC 特征 选择 之 后 得 到 的 低 维特 征集 合 的 识别 率 ， 本 
文 算法 的 识别 率 结果 表明 ， 采 用 投票 组 合 分 类 器 的 方法 与 单个 
CRC 分 类 器 相 比 ， 组 合 分 类 器 的 分 类 识别 性 能 明显 更 优 。 
表 4 不 同 特征 集合 下 的 个 体 识别 率 (%) 


特征 集 电台 1 电台 2 电台 3 电台 4 平均 
五 78.43 81.20 83.37 65.02 77.01 
Ey 76.84 80.66 83.21 62.78 75.87 
bE 80.65 86.27 85.74 81.30 83.49 
FE 78.97 84.23 84.33 78.88 81.60 


DL 


已 75.71 82.54 83.40 75.48 79.28 

已 76.50 82.34 85.37 77.83 80.51 

本 文 算 法 85.64 89.81 90.70 86.52 88.17 
4 ”结束 语 


提出 了 一 种 基于 CMFS-MIC 特征 选择 的 跳 频 电台 网 台 分 
选 方法 ， 该 方法 兼顾 了 特征 与 类 别 之 间 的 相关 性 和 特征 之 间 的 
元 余 性 对 特征 集 进 行 排序 ， 并 用 近似 马尔 可 夫 毯 的 方法 删除 元 
余 特 征 和 不 相关 特征 得 到 最 优 的 特征 子 集 。 在 分 类 识别 阶段 ， 
基于 SVM 分 类 器 和 CRC 分 类 器 设计 了 投票 组 合 分 类 器 。 实 验 
结果 验证 了 本 文 所 提 特 征 选 择 算法 CMFS-MIC 的 有 效 性 以 及 
本 文 算法 提高 了 电台 分 选 的 识别 率 ， 但 是 存在 的 不 足 之 处 是 特 
征 选 择 过 程 计算 复杂 ， 导 致 算法 单 次 实验 整体 的 计算 复杂 度 仍 
然 很 大 ， 有 待 往 后 的 研究 进行 改进 。 
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